智能论文笔记

Active Domain-Invariant Self-Localization Using Ego-Centric and World-Centric Maps

Kanya Kurauchi , Kanji Tanaka , Ryogo Yamamoto , Mitsuki Yoshida

分类：机器人 | 人工智能

2022-04-22

在自主机器人导航中，对视觉场所识别（VPR）的次数最佳观看（NBV）计划者的培训是一项重要的任务，典型的方法是使用目标域中收集的视觉体验作为培训数据。但是，对于实时的机器人应用，在日常导航中收集了各种各样的视觉体验。我们通过采用小说{\ it domain-invariant} NBV计划来解决这个问题。假定基于卷积神经网络（CNN）的标准VPR子系统可用，并建议将其域不变状态识别能力转移以训练域不变的NBV计划者。具体而言，我们将CNN模型可用的视觉提示分为两种类型：输出层提示（OLC）和中间层提示（ILC）。 OLC可在CNN模型的输出层上可用，旨在估计机器人的状态（例如，机器人观点）相对于以世界为中心的视图坐标系。 ILC在CNN模型的中间层中可用，作为对以自我为中心的视图的视觉内容（例如显着图像）的高级描述。在我们的框架中，ILC和OLC被映射到国家向量，随后用于通过深入的强化学习来训练多视NBV规划师。使用公共NCLT数据集的实验验证了提出方法的有效性。

translated by 谷歌翻译

无数据知识蒸馏（DFKD）最近一直吸引了研究社区的越来越关注，归因于其仅使用合成数据压缩模型的能力。尽管取得了令人鼓舞的成果，但最先进的DFKD方法仍然患有数据综合的低效率，使得无数据培训过程非常耗时，因此可以对大规模任务进行不适当的。在这项工作中，我们介绍了一个被称为FastDFKD的有效方案，使我们能够将DFKD加速到数量级。在我们的方法中，我们的方法是一种重用培训数据中共享共同功能的新策略，以便综合不同的数据实例。与先前的方法独立优化一组数据，我们建议学习一个Meta合成器，该综合仪寻求常见功能作为快速数据合成的初始化。因此，FastDFKD仅在几个步骤内实现数据综合，显着提高了无数据培训的效率。在CiFAR，NYUV2和Imagenet上的实验表明，所提出的FastDFKD实现了10美元\时代$甚至100美元\倍$加速，同时保持与现有技术的表现。

translated by 谷歌翻译